Consulta de Guías Docentes



Academic Year/course: 2021/22

60949 - Management of Large-Scale Data


Syllabus Information

Academic Year:
2021/22
Subject:
60949 - Management of Large-Scale Data
Faculty / School:
110 - Escuela de Ingeniería y Arquitectura
Degree:
533 - Master's Degree in Telecommunications Engineering
623 - Master's Degree in Telecommunications Engineering
ECTS:
6.0
Year:
2
Semester:
Second semester
Subject Type:
Optional
Module:
---

1. General information

2. Learning goals

3. Assessment (1st and 2nd call)

4. Methodology, learning tasks, syllabus and resources

4.1. Methodological overview

The methodology followed in this course is oriented towards achievement of the learning objectives. A wide range of teaching and learning tasks are implemented, such as

Activities with direct support from the teachers

  • Theory sessions. Teacher's presentation of the course contents, including illustrative examples.
  • Talks by experts. When possible, external experts to the university will explain some contents.
  • Seminars. Sessions based on oral or written contributions by the students.
  • Problem-based learning. Educative approach oriented towards a teaching and learning methodology where
    students tackle real problems in small groups under the supervision of a teacher.
  • Practice sessions. Any practical or collaborative activity done with direct support from the teachers.
  • Laboratory sessions. Activities developed with computers.
  • Tutorials. Students can review or discuss with the teacher the materials and topics presented in the theory
    sessions.
  • Assessment. A set of written/oral tests, lab assignments, projects, other assignments, etc.

Autonomous work

  • Theoretical assignments. Preparing seminars, readings, research, assignments or write reports, etc., to be submitted or presented to the teacher in theory sessions.
  • Practical assignments. Preparing activities to be submitted or presented to the teacher in practice sessions.
  • Theoretical study. Study of contents related to the theory sessions: it includes any study activity not considered
    previously (study for exams, work in the library, complementary readings, solve problems and exercises, etc.).
  • Practical study. Related to the practice sessions.
  • Complementary activities. Formative activities related to the course, but not to the preparation of exams or included
    within the assessment activities: readings, seminars, videos, etc.

4.2. Learning tasks

The course (6 ECTS: 150 hours) includes the following learning tasks:

  • Activities under direct supervision of the teachers of the course (60 hours). Theory sessions, expert talks, seminars, problem-solving and cases, and lab assignments.
  • Practice and research assignments (60 hours).
  • Tutorials (5 hours).
  • Autonomous work and study (20 hours).
  • Assessment (5 hours). Exam and defense of the course project.

4.3. Syllabus

The course will address the following topics:

  1. Introduction and motivation to the problem of large volumes of data (Big Data).
  2. Storage of large amounts of data
    • Data warehouses. Star schema design.
    • NoSQL databases.
  3. Management of large amounts of data
    • Data distribution.
    • Information integration considering heterogeneous data sources.
    • Use of knowledge representation techniques (ontologies) to represent data sources and their access and integration.
    • Parallel processing techniques: MapReduce (Hadoop).
    • Data Stream Management Systems.
    • Other techniques: mobile agents.
  4. Interaction with large amounts of data
    • Visualization techniques.
    • Design of appropriate user interfaces.
    • Usability.
  5. Analysis of large amounts of data
    1. Data mining.
    2. Text mining, sentiment analysis.
  6. Use cases and applications
    • Data provided by sensors.
    • Unstructured data on the Web.
    • Recommendation Systems.
    • Analysis of blogs and social networks.
    • Smart cities.
    • Intelligent Transportation Systems.

Some of the topics will be addressed through autonomous work by the students and through the development of practical
assignments, considering (to the extent possible) the preferences of the students.

4.4. Course planning and calendar

Further information concerning the timetable, office hours, assessment dates and other details regarding this course, will be provided on the first day of class and/or the faculty's website.

 

4.5. Bibliography and recommended resources

http://psfunizar10.unizar.es/br13/egAsignaturas.php?codigo=60949


Curso Académico: 2021/22

60949 - Manipulación y análisis de grandes volúmenes de datos


Información del Plan Docente

Año académico:
2021/22
Asignatura:
60949 - Manipulación y análisis de grandes volúmenes de datos
Centro académico:
110 - Escuela de Ingeniería y Arquitectura
Titulación:
533 - Máster Universitario en Ingeniería de Telecomunicación
623 - Máster Universitario en Ingeniería de Telecomunicación
Créditos:
6.0
Curso:
2
Periodo de impartición:
Segundo semestre
Clase de asignatura:
Optativa
Materia:
---

1. Información Básica

1.1. Objetivos de la asignatura

La asignatura y sus resultados previstos responden a los siguientes planteamientos y objetivos:

La asignatura estará centrada en la comprensión, el análisis y la evaluación de los siguientes contenidos:

  • Importancia de los datos y de su análisis en diferentes ámbitos de aplicación. Perspectiva del diseñador, usuario y analista.
  • Técnicas de interacción y visualización. Diseño centrado en el usuario. Evaluación de la usabilidad de aplicaciones y software. Aplicación al diseño de aplicaciones interactivas.
  • Modelos de almacenamiento y procesamiento de grandes volúmenes de datos.
  • Sistemas y metodologías para el análisis y manipulación de datos.

Con el desarrollo de la asignatura, y de conformidad con las competencias y resultados de aprendizaje esperados, se pretenden lograr los siguientes objetivos:

  • Que el estudiante analice, dado un problema que implica grandes volúmenes de datos, los requisitos necesarios para su gestión (almacenamiento, transferencia, procesamiento, visualización e interacción).
  • Que el estudiante desarrolle los elementos necesarios para integrar fuentes de datos heterogéneas, utilizando técnicas clásicas para la representación, tratamiento, análisis, visualización e interacción con repositorios de datos heterogéneos.
  • Que el estudiante desarrolle una aplicación para un contexto dado, donde sea necesaria la gestión de grandes volúmenes de datos, y teniendo en cuenta criterios de escalabilidad, usabilidad y normativos.

Estos planteamientos y objetivos están alineados con algunos de los Objetivos de Desarrollo Sostenible, ODS, de la Agenda 2030 (https://www.un.org/sustainabledevelopment/es/) y determinadas metas concretas, de tal manera que la adquisición de los resultados de aprendizaje de la asignatura proporciona capacitación y competencia al estudiante para contribuir en cierta medida a su logro:

  • Objetivo 10: Reducir la desigualdad en y entre los países.
    • Meta 10.2. De aquí a 2030, potenciar y promover la inclusión social, económica y política de todas las personas, independientemente de su edad, sexo, discapacidad, raza, etnia, origen, religión o situación económica u otra condición.

El conjunto de los resultados de aprendizaje de la asignatura se puede resumir diciendo que el alumnado será capaz de diseñar soluciones para la gestión y el análisis de grandes volúmenes de datos en distintos escenarios, escogiendo entre las soluciones tecnológicas existentes de forma adecuada. Dado que la adecuada gestión de datos digitales es fundamental para abordar retos de los ODS, se considera que la adquisición de los resultados de aprendizaje de la asignatura proporciona capacitación y competencia al estudiante para contribuir en cierta medida al logro de los Objetivos de Desarrollo Sostenible de forma transversal.

1.2. Contexto y sentido de la asignatura en la titulación

En esta asignatura se realiza un recorrido por todos los aspectos que representan el reto introducido por los grandes volúmenes de datos, desde el diseño hasta la manipulación, procesado y análisis.

1.3. Recomendaciones para cursar la asignatura

El estudiante que curse esta asignatura debería haber cursado asignaturas previas relacionadas con bases de datos y sistemas de información.

2. Competencias y resultados de aprendizaje

2.1. Competencias

Al superar la asignatura, el estudiante será más competente para...

CG11: Capacidad para saber comunicar (de forma oral y escrita) las conclusiones -y los conocimientos y razones últimas que las sustentan- a públicos especializados y no especializados de un modo claro y sin ambigüedades.

CG12: Poseer habilidades para el aprendizaje continuado, autodirigido y autónomo.

CE6: Capacidad para modelar, diseñar, implantar, gestionar, operar, administrar y mantener redes, servicios y contenidos.

2.2. Resultados de aprendizaje

El estudiante, para superar esta asignatura, deberá demostrar los siguientes resultados...

  1. Comprender y especificar los requisitos necesarios para la interacción, almacenamiento, transferencia y procesado de grandes volúmenes de datos.
  2. Conocer, comprender y aplicar las técnicas más comunes para la representación, tratamiento, análisis e interacción con repositorios de datos heterogéneos.
  3. Diseñar, desarrollar y evaluar una aplicación que facilite la elaboración y gestión de grandes volúmenes de datos, conforme a criterios de escalabilidad y normativa existente.

2.3. Importancia de los resultados de aprendizaje

El conjunto de los resultados de aprendizaje se puede resumir diciendo que el estudiantado será capaz de diseñar soluciones para la gestión y el análisis de grandes volúmenes de datos en distintos escenarios, escogiendo entre las soluciones tecnológicas existentes de forma adecuada. Esto es de gran importancia hoy en día en el mundo laboral, ya que multitud de empresas privadas e instituciones públicas, así como otras entidades especializadas en ámbitos concretos, cuentan con grandes volúmenes de datos que necesitan gestionar. Términos como Big Data, Data Science, Data Analytics, Data Warehouses, Business Intelligence, y Data Mining, están cobrando especial importancia en los últimos años, dada la necesidad de profesionales en este ámbito.

3. Evaluación

3.1. Tipo de pruebas y su valor sobre la nota final y criterios de evaluación para cada prueba

El estudiante deberá demostrar que ha alcanzado los resultados de aprendizaje previstos mediante las siguientes actividades de evaluacion

  • Realización y presentación de trabajos. Estudio de un tema relacionado con la asignatura, elaboración de un informe sobre el mismo, y su presentación en clase. [20%]. Resultados de aprendizaje: 1, 2 y 3.
  • Proyecto. Un proyecto de grupo con ordenadores, en el que se podrán en práctica los conocimientos y habilidades adquiridos en la asignatura. [50%]. Resultados de aprendizaje: 1, 2 y 3.
  • Prueba final escrita incluyendo preguntas de respuesta corta y de respuesta extensa. [30%]. Resultados de aprendizaje: 1, 2 y 3.

Para promediar, será necesario aprobar individualmente cada una de las actividades de evaluación.

El estudiante que no opte por el procedimiento de evaluación descrito anteriormente, que no supere dichas pruebas durante el periodo docente o que quisiera mejorar su calificación tendrá derecho a realizar una prueba global que será programada dentro del periodo de exámenes correspondiente a la primera o segunda convocatoria, según corresponda. Dicha prueba global constará de las siguientes actividades de evaluación: 1) realización y presentación del trabajo indicado previamente (estudio de un tema) [20%], 2) realización y defensa del proyecto (prácticas de la asignatura) [50%], y 3) realización de una prueba final escrita incluyendo preguntas de respuesta corta y de respuesta extensa [30%]. Para promediar, será necesario aprobar individualmente cada una de las actividades de evaluación.

4. Metodología, actividades de aprendizaje, programa y recursos

4.1. Presentación metodológica general

El proceso de aprendizaje que se ha diseñado para esta asignatura se basa en lo siguiente:

Las actividades de enseñanza y aprendizaje con soporte directo por parte del profesorado se basan en:

  1. Clase magistral. Exposición de contenidos mediante presentación o explicación por parte de un profesor (posiblemente incluyendo demostraciones).
  2. Charlas de expertos. Cuando sea posible, se contará con la exposición de contenidos mediante presentación o explicación por parte de un experto externo a la Universidad.
  3. Seminario. Período de instrucción basado en contribuciones orales o escritas de los estudiantes.
  4. Aprendizaje basado en problemas. Enfoque educativo orientado al aprendizaje y a la instrucción en el que los estudiantes abordan problemas reales en pequeños grupos y bajo la supervisión de un tutor
  5. Clases prácticas. Cualquier tipo de actividad de carácter práctico o colaborativo con soporte directo del
    profesorado.
  6. Laboratorio. Actividades desarrolladas con ordenadores.
  7. Tutoría. Período de instrucción realizado por un tutor con el objetivo de revisar y discutir los materiales y temas presentados en las clases.
  8. Evaluación. Conjunto de pruebas escritas, orales, prácticas, proyectos, trabajos, etc. utilizados en la evaluación del progreso del estudiante

 Las actividades de enseñanza y aprendizaje sin soporte directo por parte del profesorado se basan en:

  1. Trabajos teóricos. Preparación de seminarios, lecturas, investigaciones, trabajos, memorias, etc. para exponer o entregar en las clases teóricas.
  2. Trabajos prácticos. Preparación de actividades para exponer o entregar en las clases prácticas.
  3. Estudio teórico. Estudio de contenidos relacionados con las "clases teóricas": incluye cualquier actividad de estudio que no se haya computado en el apartado anterior (estudiar exámenes, trabajo en biblioteca, lecturas complementarias, hacer problemas y ejercicios, etc.).
  4. Estudio práctico. Relacionado con las "clases prácticas".
  5. Actividades complementarias. Son tutorías no académicas y actividades formativas voluntarias relacionadas con la asignatura, pero no con la preparación de exámenes o con la calificación: lecturas, seminarios, jornadas, vídeos, etc.

4.2. Actividades de aprendizaje

El programa que se ofrece al estudiante para ayudarle a lograr los resultados previstos comprende las siguientes actividades...

Trabajo del estudiante

La asignatura consta de 6 créditos ECTS que suponen una dedicación estimada por parte del estudiante de 150 horas distribuidas del siguiente modo: 

  • Actividades dirigidas por el profesorado de la asignatura: 60 h (Clase magistral, Resolución de problemas y casos, Prácticas de laboratorio, Prácticas especiales)

  • Realización de trabajos de aplicación o investigación prácticos:  60 h
  • Tutela personalizada profesor-alumno: 5 h
  • Estudio de teoría: 20 h
  • Pruebas de evaluación: 5 h

4.3. Programa

  • Introducción y motivación al problema de los grandes volúmenes de datos (Big Data).
  • Almacenamiento de grandes volúmenes de datos:
    • Almacenes de datos (data warehouses). Diseño en estrella.
    • Bases de datos NoSQL.
  • Gestión de grandes volúmenes de datos:
    • Distribución de los datos.
    • Integración de información con fuentes de datos heterogéneas.
    • Uso de técnicas de representación del conocimiento (ontologías) para la representación de fuentes de datos y su acceso e integración.
    • Técnicas de procesamiento paralelo: MapReduce (Hadoop).
    • Sistemas de gestión de flujos de datos (data streams).
    • Otras técnicas: agentes móviles.
  • Interacción con grandes volúmenes de datos:
    • Técnicas de visualización.
    • Diseño de interfaces de usuario apropiados.
    • Usabilidad.
  • Análisis de grandes volúmenes de datos:
    • Minería de datos.
    • Minería de textos, análisis del sentimiento.
  • Casos de uso y aplicaciones, tales como:
    • Datos provenientes de sensores.
    • Datos no estructurados en la Web.
    • Sistemas de recomendación.
    • Análisis de blogs y redes sociales.
    • Ciudades inteligentes (smart cities).
    • Sistemas de Transporte Inteligentes.

Algunos temas del programa se tratarán a través del trabajo autónomo del estudiantado y la realización de trabajos de carácter práctico, teniendo en cuenta en la medida de lo posible los intereses del estudiantado.

4.4. Planificación de las actividades de aprendizaje y calendario de fechas clave

El calendario de clases, prácticas y exámenes, así como las fechas de entrega de trabajos de evaluación, se anunciará con suficiente antelación, de acuerdo con las sesiones y fechas establecidas por el centro.

4.5. Bibliografía y recursos recomendados

http://psfunizar10.unizar.es/br13/egAsignaturas.php?codigo=60949